Age and gender in language, emoji, and emoticon usage in instant messages

نویسندگان

چکیده

Text is one of the most prevalent types digital data that people create as they go about their lives. Digital footprints people's language usage in social media posts were found to allow for inferences age and gender. However, even more potentially sensitive text from instant messaging services has remained largely uninvestigated. We analyze variations messages with regard individual differences gender by replicating extending methods used prior research on posts. Using a dataset 309,229 WhatsApp 226 volunteers, we identify unique age- gender-linked variations. use cross-validated machine learning algorithms predict volunteers' (MAEMd = 3.95, rMd 0.81, R2Md 0.49) (AccuracyMd 85.7%, F1Md 0.67, AUCMd .82) significantly above baseline-levels predictive features. discuss implications psycholinguistic theory, present opportunities application author profiling, suggest methodological approaches making predictions small sets. Given recent trend towards dominant private increasingly weaker user protection, highlight rising threats privacy rights messaging.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

the relationship between listening self efficacy, listening comprehension, gende, and age in male and female english learners

چکیده هدف اصلی تحقیق حاضر مطالعه و بررسی رابطه بین خودکارامدی شنیداری با درک شنیداری بود.همچنین رابطه درک شنیداری وخودکارآمدی شنیداری با جنسیت و رابطه خودکارامدی شنیداری با سن نیز مورد بررسی قرار گرفت.تعداد شصت زبان اموز-سی دختر و سی پسر- کانون زبان ایران در مرکز خرم آباد به صورت تصادفی انتخاب شدند. روشهای به کار رفته در جمع اوری داده ها عبارت بودند ازبرسشنامه خودکارآمدی و تست درک شنیداری لانگ...

15 صفحه اول

manipulation in dubbing and subtitling

پژوهش حاضر در چارچوب مکتب دستکاری قرار گرفت و با استفاده از تقسیم بندی دوکات (2007) از شیوه های دستکاری، به دنبال یافتن پاسخ برای پرسش های زیر بود: 1-رایج ترین شیوه دستکاری در دوبله فیلم ها کدام است؟ 2-رایج ترین شیوه دستکاری در زیرنویس فیلم ها کدام است؟ 3-دستکاری در دوبله فیلم ها رایج تر است یا در زیرنویس آن ها؟ این پژوهش از نوع تحقیقات توصیفی- مقایسه ای و پیکره ای می باشد. پیکره تحقیق شا...

efl students gender and socioeconomic status: the use of politeness strategies in the first and second languages

within the components of communicative competence, a special emphasis is put on the “rules of politeness,” specifically the politeness strategies (brown and levinson, 1978) that speakers deploy when performing the request speech act. this is because the degree of imposition that making a request places upon one’s interlocutor(s) has been seen to be influenced by several factors among which, as ...

ترجمه،نقدوبررسی بخش پایانی کتاب : women family and gender in islamic law

موضوع این تحقیق ترجمه ، نقدوبررسی بخش پایانی کتابی است بانام "women, family and gender in islamic law" [زنان، خانواده وجنسیت درحقوق اسلام]. اصل کتاب به زبان انگلیسی است؛ ما علاوه برترجمه، برآن حاشیه نیززده ایم. ونهایتا نقدوبررسی نیز کرده ایم. درفصل نقدوبررسی پس ازایرادمقدمه، نخستین سخن را به بحثی به نام "تنازع پیش فرض ها" اختصاص دادیم. جان سخن ما دراین بحث این است که ازآنجاکه مسلمانان باغیرمسل...

15 صفحه اول

comparative study of gender representation in top notch and ili series

esl/efl books play a crucial role in shaping language learners worldview of gender roles in society. the present study investigated the status of sexism in two sets of efl textbooks, one developed by non-native iranian authors (ili series) and the other by native authors (top notch series). first, two books from each series was selected randomly. then, a quantitative analysis was carried out wi...

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Computers in Human Behavior

سال: 2022

ISSN: ['1873-7692', '0747-5632']

DOI: https://doi.org/10.1016/j.chb.2021.106990